from gensim import corpora, models, similarities

# 定义两个文本字符串
text1 = "我喜欢看电影"
text2 = "他喜欢看电影"

# 转换为词袋模型
texts = [[text1], [text2]]
dictionary = corpora.Dictionary(texts)
corpus = [dictionary.doc2bow(text) for text in texts]

# 使用LSI模型
lsi = models.LsiModel(corpus, id2word=dictionary, num_topics=2)  # num_topics可以根据需求调整
index = similarities.MatrixSimilarity(lsi[corpus])

# 计算相似度并打印
sims = index[lsi[corpus]]
print("Text similarity (0 - 1):", sims[0][1])  # 相似度范围通常是0到1，数值越大表示越相似